When testing conditions differ from those represented in training data, so-called out-of-distribution (OOD) inputs can mar the reliability of black-box learned components in the modern robot autonomy stack. Therefore, coping with OOD data is an important challenge on the path towards trustworthy learning-enabled open-world autonomy. In this paper, we aim to demystify the topic of OOD data and its associated challenges in the context of data-driven robotic systems, drawing connections to emerging paradigms in the ML community that study the effect of OOD data on learned models in isolation. We argue that as roboticists, we should reason about the overall system-level competence of a robot as it performs tasks in OOD conditions. We highlight key research questions around this system-level view of OOD problems to guide future research toward safe and reliable learning-enabled autonomy.
translated by 谷歌翻译
多限制攀岩机器人的运动计划必须考虑机器人的姿势,联合扭矩,以及它如何使用接触力与环境相互作用。本文着重于使用非传统运动来探索不可预测的环境(例如火星洞穴)的机器人运动计划。我们的机器人概念Reachbot使用可扩展和可伸缩的动臂作为四肢,在攀爬时实现了大型可伸缩度工作区。每个可扩展的动臂都由旨在抓住岩石表面的微生物抓地力封顶。 Reachbot利用其大型工作空间来绕过障碍物,裂缝和挑战地形。我们的计划方法必须具有多功能性,以适应可变的地形特征和鲁棒性,以减轻用刺抓握随机性质的风险。在本文中,我们引入了一种图形遍历算法,以根据适用于握把的可用地形特征选择一个离散的grasps序列。该离散的计划是由一个解耦运动计划者互补的,该计划者使用基于抽样的计划和顺序凸面编程的组合来考虑身体运动和最终效应器运动的交替阶段,以优化单个阶段。我们使用运动规划师在模拟的2D洞穴环境中计划轨迹,至少有95%的成功概率,并在基线轨迹上表现出改善的鲁棒性。最后,我们通过对2D平面原型进行实验来验证运动计划算法。
translated by 谷歌翻译
随着输入分布在任务寿命中的发展,保持基于学习的模型的性能变得具有挑战性。本文提出了一个框架,可以通过选择标签的测试输入子集来逐步重新训练模型,从而使模型适应更改输入分布。根据(1)整个任务生命周期的模型性能以及(2)与标签和模型再培训相关的累积成本,对此框架中的算法进行了评估。我们提供了卫星姿势估计模型的开源基准,该基准在空间中的卫星图像中训练并部署在新颖场景中(例如,不同的背景或不良行为的像素),在其中评估了算法,以通过在其能力上通过在其上进行高性能来维持高性能的能力。输入的子集。我们还提出了一种新颖的算法,以通过使用贝叶斯不确定性量化从输入中表征信息获得的信息增益,并选择一个子集,并选择一个子集,该子集使用批处理主动学习中的概念来最大化集体信息增益。我们表明,我们的算法在基准上的表现优于其他算法,例如,达到与100%输入标签的算法相当的性能,而仅标记了50%的输入,从而在任务寿命中产生了低成本和高性能。
translated by 谷歌翻译
由于管理部分微分方程的半差异,例如通过有限元方法。这些系统的复杂性提出了直接应用自动控制的计算挑战。虽然模型还原已在控制中看到无处不在的应用,但在这种情况下使用非线性模型还原方法仍然很困难。问题在于在降低的订单模型中保留非线性动力学的结构,以进行高保真控制。在这项工作中,我们利用光谱亚曼佛(SSM)理论的最新进展来使模型在明确的假设下降低,以有效地合成反馈控制器。
translated by 谷歌翻译
由于其固有的非线性和高度的自由度,对连续体软机器人的建模和控制仍然是一项艰巨的任务。这些复杂性阻碍了适合实时控制的高保真模型的构建。尽管已经提出了各种模型和基于学习的方法来应对这些挑战,但它们缺乏普遍性,很少保留动态的结构。在这项工作中,我们提出了一种新的,数据驱动的方法,用于从数据中提取面向控制的模型。我们克服了上面概述的问题,并证明了我们对光谱次级减少(SSMR)的卓越性能 - \'a-vis the Art的状态。
translated by 谷歌翻译
为了实现安全的自动驾驶汽车(AV)操作,至关重要的是,AV的障碍检测模块可以可靠地检测出构成安全威胁的障碍物(即是安全至关重要的)。因此,希望对感知系统的评估指标捕获对象的安全性 - 临界性。不幸的是,现有的感知评估指标倾向于对物体做出强烈的假设,而忽略了代理之间的动态相互作用,因此不能准确地捕获现实中的安全风险。为了解决这些缺点,我们通过考虑自我车辆和现场障碍之间的闭环动态相互作用来引入互动障碍感知障碍检测评估度量指标。通过从最佳控制理论借用现有理论,即汉密尔顿 - 雅各比的可达性,我们提出了一种可构造``安全区域''的计算障碍方法:一个国家空间中的一个区域,该区域定义了安全 - 关键障碍为了定义安全目的的位置指标。我们提出的安全区已在数学上完成,并且可以轻松计算以反映各种安全要求。使用Nuscenes检测挑战排行榜的现成检测算法,我们证明我们的方法是计算轻量级,并且可以更好地捕获与基线方法更好地捕获关键的安全感知错误。
translated by 谷歌翻译
我们在最近的基于学习的控制方法中确定了一个问题,这些控制的使用随机微分方程重新重新设计了具有不确定动态的系统。具体地,我们讨论用固定但不确定参数(认知源不确定的源)替换模型的近似值,该模型受到作为布朗运动(对应于炼米不确定性)的外部干扰。
translated by 谷歌翻译
当在高风险机器人应用程序中部署机器学习模型时,检测不安全情况的能力至关重要。当迫在眉睫的情况下(在没有纠正措施的情况下),预警系统可以提供警报。为了可靠地提高安全性,这些警告系统应具有可证明的假负率;即,在没有警报的情况下,将发生不安全的情况,少于$ \ epsilon $。在这项工作中,我们提出了一个框架,将一种统计推理技术与机器人/环境动力学的模拟器相结合,以调整警告系统,以实现$ \ epsilon $ false的负率,使用$ 1//$ 1/\ epsilon $数据点。我们将框架应用于驾驶员警告系统和机器人抓握应用程序,并在经验上证明了错误的负率,同时也观察到较低的虚假检测(正)率。
translated by 谷歌翻译
由于关键的至关重要的自动驾驶汽车(AV)将很快在我们的社会中普遍存在,因此最近在整个行业和学术界都提出了许多可信赖的AV部署的安全概念。然而,在适当的安全概念上达成共识仍然是一项艰巨的任务。在本文中,我们倡导使用汉密尔顿 - 雅各布(HJ)的可及性作为比较现有安全概念的统一数学框架,并通过该框架的元素提出了定制安全概念(从而将其适用性扩展到方案)与方案的方法,从而将其与方案相关。以数据驱动方式对代理行为的隐性期望。具体而言,我们表明(i)现有的主要安全概念可以嵌入到HJ可达性框架中,从而实现一种共同的语言来比较和对比建模假设,并且(ii)HJ可达性可以作为感应性偏见,以有效地理由,在一个学习环境,大约是两个关键但经常被忽视的安全方面:责任和上下文依赖性。
translated by 谷歌翻译
概率分类器输出置信信心得分随着他们的预测,并且应该校准这些置信分数,即,它们应该反映预测的可靠性。最小化标准度量的置信度分数,例如预期的校准误差(ECE)准确地测量整个人口平均值的可靠性。然而,通常不可能测量单独预测的可靠性。在这项工作中,我们提出了本地校准误差(LCE),以跨越平均值和各个可靠性之间的间隙。对于每个单独的预测,LCE测量一组类似预测的平均可靠性,其中通过预先训练的特征空间上的内核函数和通过预测模型信仰的融合方案来量化相似性。我们从理论上显示了LCE可以从数据估计,并经验地发现它显示出比ECE可以检测到更细粒度的错误级别模式。我们的关键结果是一种新颖的局部重新校准方法,以改善个人预测的置信度分数并减少LCE。实验,我们表明我们的重新校准方法产生更准确的置信度分数,从而提高了具有图像和表格数据的分类任务的下游公平性和决策。
translated by 谷歌翻译